HTML (acrònim d’Hyper Text Markup Language, en català, "llenguatge de marcat d'hipertext"), és un llenguatge de marcat que deriva de l'SGML dissenyat per estructurar textos i relacionar-los en forma d'hipertext. Gràcies a Internet i als navegadors web, s'ha convertit en un dels formats més populars que existeixen per a la construcció de documents per a la web.
En el seu origen, l'HTML era un llenguatge dissenyat per compartir informació científica entre científics de tot el món. Era purament un llenguatge estructural, en què no hi havia forma de descriure l'aparença de les pàgines (ni tan sols la possibilitat de posar un text en negreta o cursiva). Més endavant s'hi van afegir nombroses opcions per formatar i presentar text i gràfics.
A mitjans de la dècada de 1990 van començar les ampliacions de l'HTML per aconseguir la presentació desitjada, però sempre des de diferents perspectives de diferents desenvolupadors, que van acabar amb diverses solucions no estàndards per a diferents navegadors. Això va provocar l'aparició d'un consorci que controla l'evolució de l'HTML: el W3C (World Wide Web Consortium).
Aquesta evolució tenia un punt_clau: la separació del contingut i l'aparença. Amb la versió 4 de l'HTML es recomanava un altre mecanisme per controlar la visualització del nostre contingut HTML: els fulls d'estil (CSS: Cascading Style Sheets).
El W3C recomana l'ús de l'XHTML, que manté la mateixa sintaxi i els mateixos mecanismes que l'HTML, però reformulat amb les normes d'un XML, preparant-se així per a aprofitar els avantatges d'aquest llenguatge.
D'altra banda el WHATWG[1]—grup de treball compost per la Fundació Mozilla[2] i Opera— estan plantejant una especificació per un HTML 5 estenent l'HTML 4.01 i el DOM.
L'HTML 5 intenta millorar la part d'aplicació web amb l'especificació Web Forms 2.0. Aquest grup surt com a reacció pel canvi brusc del pas d'HTML a XHTML que, si no fos per l'Apendix C de l'especificació XHTML 1.0[3] no es podria usar en navegadors que no suporten el MIME type application/xhtml+xml
.
No s'ha d'entendre el WHATWG com una organització paral·lela al W3C sinó un grup complementari, ja que quan té un esborrany el proposa al W3C per tal d'estandarditzar-lo.
La darrera especificació vigent és l'XHTML 1.1 que ja no contempla cap compatibilitat amb versions anteriors i, per tant, només es pot servir com a application/xhtml+xml
excloent qualsevol navegador antic.
El punt més polèmic actualment és la proposta d'especificació (en estat d'esborrany) XHTML 2.0 que deixa de ser compatible amb versions anteriors no només a nivell de MIME type sinó que l'estructura de document i elements estructurals canvien.
Les etiquetes bàsiques d'HTML, d'obligada presència en tot document són:
<!DOCTYPE>: És l'etiqueta que permet definir el tipus de document HTML que s'empra. Existeixen tres tipus bàsics: l'estricte (Strict), el transicional (Transitional) i el de marcs (Frameset).
<html>
: És l'etiqueta arrel de qualsevol document HTML o XHTML.<head>
: Defineix la capçalera del document HTML. Permet declarar metainformació del document que no es mostra directament en el navegador. Aquesta informació és d'especial rellevància pels indexadors i cercadors automàtics.<body>
: Defineix el cos del document. Aquesta és la part del document HTML que es mostra en el navegador.Dintre de la capçalera <HEAD>
s'hi pot trobar:
<title>
: Permet definir el títol de la pàgina. En navegadors gràfics el contingut del title
apareix a la barra del títol a sobre de la finestra.<meta>
: Permet definir metainformacions del document tals com l'autor, la data de realització, la codificació del document (UTF, ISO, etc.), les paraules clau i la descripció del mateix<LINK>
: Permet definir metadades complementàries a les del meta
tals com el document anterior, el següent, el capítol al qual pertany el document, la pàgina glossari, etc.Dintre del cos <BODY>
s'hi pot trobar:
<a>
: Etiqueta àncora. Crea un enllaç a un altre document o a una altra zona d'aquest, segons els atributs.<h1>, <h2>,… <h6>
: capçaleres o títols del document, acostumen a distingir-se per mida.<div>
: Divisió estructural de la pàgina.<p>
: Paràgraf.<br>
: Salt de línia.<table>: Indica el començament d'una taula, després s'haurà de definir les files amb <tr>
i les cel·les dintre de les files amb <td>
.
<ul>
: Llista desordenada (sense numerar). Els ítems es defineixen amb <li>
.<ol>
: Llista ordenada (numerat). Els ítems es defineixen amb <li>
.<dl>
: Llista de definició. Hi ha dos tipus d'ítem; el dt
i el dd
.
<dt>
: Terme a definir.<dd>
: Definició del terme.Excepte unes poques etiquetes, la majoria requereixen ser tancades escrivint la mateixa etiqueta precedida d'una barra "/". Exemple: <html>…</html>